تصحیح خودکار خطا در درخت بانک نحوی با استفاده از یادگیری ماشینی انتقال محور

Authors

فرزانه زارعی

farzaneh zarei دانشگاه تهران هشام فیلی

hesham faili دانشگاه تهران مریم میریان

maryam mirian دانشگاه تهران

abstract

درخت بانک یکی از پرکاربردترین منابع در به کارگیری روش های یادگیری باسرپرستی و نیمه سرپرستی در سامانه های پردازش زبان های طبیعی مانند ابزارهای شناسایی گفتار، تحلیلگرهای نحوی و نرم افزارهای مترجم ماشینی است. روش های مختلفی جهت تولید درخت بانک وجود دارد که می توان آن ها را به دو طبقه ی اصلی، روش های تولید دستی و روش های تولید خودکار تقسیم کرد. در هر یک از این روش ها، درخت بانک حاصل دارای خطاهایی هستند که البته میزان این خطاها در روش تولید خودکار به مراتب بیشتر است. وجود خطا در درخت بانک باعث می شود که نتوان از آن به عنوان یک منبع مناسب استفاده کرد. در این مقاله یک روش کاملا خودکار ارائه شده است که در آن سعی شده یک درخت بانک که با دستور درخت-پیوندی لغوی برچسب گذاری شده است، اصلاح گردد. روش ارائه شده نوعی روش تشخیص و تصحیح خطا براساس یادگیری انتقال محور است و بر روی یک درخت بانک که پیشتر به روش خودکار تولید شده بود اجرا شد و سبب بهبود آن بانک از 68% به 79% طبق معیار f1 شد.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

ارائۀ راهکاری قاعده‌مند جهت تبدیل خودکار درخت تجزیۀ نحوی وابستگی به درخت تجزیۀ نحوی ساخت‌سازه‌ای برای زبان فارسی

In this paper, an automatic method in converting a dependency parse tree into an equivalent phrase structure one, is introduced for the Persian language. In first step, a rule-based algorithm was designed. Then, Persian specific dependency-to-phrase structure conversion rules merged to the algorithm. Subsequently, the Persian dependency treebank with about 30,000 sentences was used as an input ...

full text

ارزیابی‌اطمینان‌پذیری تصفیه‌خانه فاضلاب شهری با استفاده از آنالیز درخت خطا

با توجه به رشد سریع جمعیت و نیاز فزاینده برای آب پاک و قابل اطمینان، تصفیه‌خانه‌های فاضلاب نقش مهمی در تامین یک منبع قابل اطمینان آب ایفا می‌نمایند. در این ارتباط اطمینان‌پذیری یک تصفیه‌خانه فاضلاب، زمانی که پساب خروجی، مجدداً استفاده شده و یا به منابع آبی تخلیه می‌شود، مسئله‌ای حیاتی است. عوامل اصلی مؤثر بر عملکرد تصفیه‌خانه‌های فاضلاب، تغییرات در ورودی، تغییرات ذاتی در فرآیندهای تصفیه و مشکلات...

full text

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

full text

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

full text

تولید درخت بانک سازه‌ای زبان فارسی به روش تبدیل خودکار

Treebanks is one of important and useful resource in Natural Language Processing tasks. Dependency and phrase structures are two famous kinds of treebanks. There have already made many efforts to convert dependency structure to phrase structure. In this paper we study an approach to convert dependency structure to phrase structure because of lack of a big phrase structure Treebank in Persian. A...

full text

My Resources

Save resource for easier access later


Journal title:
پردازش علائم و داده ها

جلد ۱۲، شماره ۳، صفحات ۹۹-۱۰۸

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023